import pandas as pd
import os

# 检查文件是否存在
file_path = 'questions.xlsx'
if not os.path.exists(file_path):
    print(f"错误: 文件 {file_path} 不存在")
    exit(1)

# 获取Excel文件的所有工作表名称
xls = pd.ExcelFile(file_path)
sheet_names = xls.sheet_names
print(f"Excel文件包含的标签页: {sheet_names}")
print(f"总共 {len(sheet_names)} 个标签页")

# 分析每个工作表的结构
for sheet_name in sheet_names:
    print(f"\n======= 分析标签页: {sheet_name} =======")
    
    # 读取工作表数据
    df = pd.read_excel(file_path, sheet_name=sheet_name)
    
    print(f"该标签页包含 {len(df)} 行数据")
    print(f"该标签页包含 {len(df.columns)} 列数据")
    print(f"列名: {list(df.columns)}")
    
    # 显示前5行数据以了解数据格式
    print("\n前5行数据:")
    print(df.head())
    
    # 检查每列的数据类型
    print("\n各列数据类型:")
    print(df.dtypes)
    
    # 检查是否有空值
    print("\n空值统计:")
    print(df.isnull().sum())